智能论文笔记

Random projections and Kernelised Leave One Cluster Out Cross-Validation: Universal baselines and evaluation tools for supervised machine learning for materials properties

Samantha Durdy , Michael Gaultois , Vladimir Gusev , Danushka Bollegala , Matthew J. Rosseinsky

分类：机器学习

2022-06-17

由于机器学习是当前计算材料科学文献中的流行主题，因此为化合物创建表示形式已成为普遍的位置。这些表示形式很少被比较，因为评估了它们的性能 - 与它们一起使用的算法的性能是非平凡的。由于研究过程引起的许多材料数据集含有偏差和偏斜，因此已经引入了一个集群交叉验证（LOCO-CV），以衡量算法在预测以前看不见的材料基团时的性能。这提出了对Loco-CV测量结果的簇大小范围的影响和控制的问题。我们提出了基于组成的表示之间的详尽比较，并研究了如何使用内核近似功能来更好地分开数据以增强Loco-CV应用程序。我们发现，在大多数测试的任务中，域知识并不能提高机器学习的性能，而带隙预测是显着的例外。我们还发现，径向基函数在所有测试的10个数据集中提高了化学数据集的线性可分离性，并为在Loco-CV过程中应用此函数的应用提供了一个框架，以改善机车-CV测量结果，无论机器学习算法如何，选择度量和复合表示的选择。我们建议将内核Loco-CV作为训练范式，以示材料数据上的算法的外推能力。

translated by 谷歌翻译

Average degree of the essential variety

Paul Breiding , Samantha Fairchild , Pierpaola Santarsiero , Elima Shehu

分类：计算机视觉

2022-12-03

The essential variety is an algebraic subvariety of dimension $5$ in real projective space $\mathbb{R}\mathrm{P}^{8}$ which encodes the relative pose of two calibrated pinhole cameras. The $5$-point algorithm in computer vision computes the real points in the intersection of the essential variety with a linear space of codimension $5$. The degree of the essential variety is $10$, so this intersection consists of 10 complex points in general. We compute the expected number of real intersection points when the linear space is random. We focus on two probability distributions for linear spaces. The first distribution is invariant under the action of the orthogonal group $\mathrm{O}(9)$ acting on linear spaces in $\mathbb{R}\mathrm{P}^{8}$. In this case, the expected number of real intersection points is equal to $4$. The second distribution is motivated from computer vision and is defined by choosing 5 point correspondences in the image planes $\mathbb{R}\mathrm{P}^2\times \mathbb{R}\mathrm{P}^2$ uniformly at random. A Monte Carlo computation suggests that with high probability the expected value lies in the interval $(3.95 - 0.05,\ 3.95 + 0.05)$.

translated by 谷歌翻译

Finding neural signatures for obesity using source-localized EEG features

Yuan Yue , Dirk De Ridder , Patrick Manning , Samantha Ross , Jeremiah D. Deng

分类：机器学习

2022-08-30

肥胖是现代社会的严重问题，因为它与生活质量大大降低了。目前进行的研究是为了探索使用脑电图（EEG）数据探索与肥胖相关的神经学证据。在这项研究中，我们开发了一种新型的机器学习模型，以使用来自EEG数据的Alpha带功能连接功能来鉴定肥胖女性的大脑网络。总体分类精度达到90％。我们的发现表明，肥胖的大脑的特征是功能失调的网络，在该网络中，负责处理自指信息（例如能量需求）的领域受到损害。

translated by 谷歌翻译

Word Play for Playing Othello (Reverses)

Samantha E. Miller Noever , David Noever

分类：机器学习

2022-07-18

诸如OpenAI的生成预训练的变压器（GPT-2/3）之类的语言模型捕获了在各种域（例如语言翻译器）和最近在游戏玩法（国际象棋，GO和Checkers）中生成文本所需的长期相关性。本研究同时应用较大的（GPT-3）和较小的（GPT-2）语言模型来探索奥赛罗（或逆转）游戏的复杂策略。鉴于《财富快速逆转》的游戏规则，语言模型不仅代表了基于以前的游戏动作的下一步动作的候选预测指标，而且还避免了游戏玩法中的稀疏奖励。语言模型会自动捕获或模拟冠军级策略。微调的GPT-2型号产生的Othello游戏范围从13-71％的完成范围不等，而较大的GPT-3型号则达到完整游戏的41％。像以前的国际象棋和Go一样，这些语言模型提供了一种新颖的方式来生成合理的游戏档案，尤其是用于比较比人类更大的样本的开放动作。这些模型的主要贡献（从两倍）放大（从1977 - 2022年开始的45年以来的45年）上放大了先前的记录，从而为研究界提供了使用其他强化学习技术进行采样的更多样化和原始的策略。

translated by 谷歌翻译

Hybrid full-field thermal characterization of additive manufacturing processes using physics-informed neural networks with data

Shuheng Liao , Tianju Xue , Jihoon Jeong , Samantha Webster , Kornel Ehmann , Jian Cao

分类：机器学习

2022-06-15

了解添加剂制造（AM）过程的热行为对于增强质量控制和实现定制过程设计至关重要。大多数纯粹基于物理的计算模型都有密集的计算成本，因此不适合在线控制和迭代设计应用程序。数据驱动的模型利用最新开发的计算工具可以作为更有效的替代品，但通常会在大量仿真数据上进行培训，并且通常无法有效使用小但高质量的实验数据。在这项工作中，我们使用物理知识的神经网络开发了AM过程的基于混合物理学的热建模方法。具体而言，通过红外摄像机测量的部分观察到的温度数据与物理定律结合在一起，以预测全场温度病史并发现未知的材料和过程参数。在数值和实验示例中，添加辅助训练数据并使用转移学习技术在训练效率和预测准确性方面的有效性，以及具有部分观察到的数据的未知参数的能力。结果表明，混合热模型可以有效地识别未知参数并准确捕获全田温度，因此它具有在AM的迭代过程设计和实时过程控制中的潜力。

translated by 谷歌翻译

Development of collective behavior in newborn artificial agents

Donsuk Lee , Samantha M. W. Wood , Justin N. Wood

分类：人工智能

2021-11-06

集体行为在动物王国范围内普遍存在。然而，迄今为止，集体行为的发展和机械基础尚未正式建立。什么学会机制推动新生动物中集体行为的发展？在这里，我们使用了深度增强学习和好奇心驱动的学习 - 深深植根于心理和神经科学研究的两种学习机制 - 建立开发集体行为的新生人工代理。像新生动物一样，我们的代理商学习来自自然主义环境中的原始感官投入的集体行为。我们的代理商还学习没有外部奖励的集体行为，只使用内在的动机（好奇心）来推动学习。具体而言，当我们在具有组织中的自然视觉环境中提高人工剂时，该代理自发地发展为自我运动，对象识别，以及对组织的偏好，迅速学习集体行为所需的所有核心技能。这项工作桥接了高维感官输入和集体动作之间的划分，导致了集体动物行为的像素与动作模型。更一般地说，我们表明，两个通用学习机制 - 深度加强学习和好奇心驱动的学习 - 足以学习来自无监督的自然体验的集体行为。

translated by 谷歌翻译

Transient growth of accelerated optimization algorithms

Hesameddin Mohammadi , Samantha Samuelson , Mihailo R. Jovanović

分类：机器学习

2021-03-14

优化算法越来越多地用于具有有限时间预算的应用中。在许多实时和嵌入式方案中，只能执行少数迭代，并且传统的收敛度量不能用于评估这些非渐近制度中的性能。在本文中，我们研究了加速的一阶优化算法的瞬态行为。对于凸二次出现问题，我们采用了线性系统理论的工具，以表明瞬态增长出现来自非正常动态的存在。我们确定存在早期迭代中的代数生长的模式的存在，并量化由这些模式引起的最佳解决方案的瞬态偏移。对于强烈凸的光滑优化问题，我们利用积分二次限制（IQC）的理论来建立核心加速算法瞬态响应的大小。我们表明，优化变量与全球最小化器之间的欧几里德距离和瞬态峰值的上升时间与问题的条件数量的平方根成比例。最后，对于条件数量的问题，我们展示了我们导致恒定因素的界限的紧张性。

translated by 谷歌翻译

Fully-automated patient-level malaria assessment on field-prepared thin blood film microscopy images, including Supplementary Information

Charles B. Delahunt , Mayoore S. Jaiswal , Matthew P. Horning , Samantha Janko , Clay M. Thompson , Sourabh Kulhare , Liming Hu , Travis Ostbye , Grace Yun , Roman Gebrehiwot

分类：机器学习 | (统计)机器学习

2019-08-05

疟疾是一种威胁生命的疾病，影响了数百万。基于显微镜的薄膜评估是（i）确定疟疾物种和（ii）定量高寄生虫感染的标准方法。通过机器学习（ML）对疟疾显微镜的完全自动化是一项具有挑战性的任务，因为预先准备的滑动在质量和表现方面差异很大，并且伪像通常超过相对较少的寄生虫。在这项工作中，我们描述了一个用于薄膜疟疾分析的完整，完全自动化的框架，该框架应用了ML方法，包括卷积神经网（CNN），该方法在大型且多样化的田间预先准备的薄膜数据集中进行了训练。定量和物种鉴定结果几乎足够准确地满足了耐药性监测和临床用例的混凝土需求。我们将方法和性能指标集中在现场用例要求上。我们讨论了将ML方法应用于疟疾显微镜的关键问题和重要指标。

translated by 谷歌翻译